Skip to content

Velkommen til Datalandsbyen!

Her kan du stille spørsmål om data, delta i diskusjoner, dele prosjekter, knytte kontakter og finne samarbeid. Forumet er åpent for alle, men du må registrere deg for å poste. Bli med og bidra til kunnskap, åpenhet og innovasjon!

  • I denne gruppen kan du dele tips og spørre om alt du måtte lure på.

    83 Emner
    252 Innlegg
    L

    @Per-Schrader Jeg skal plukke opp tråden over nyttår. Blant annet sjekke planene for å oppdatere biblioteket for å konvertere fra Swagger/Open API specification (OAS) til DCAT. Tillater meg å nevne kollega @terje-sylvarnes som jeg tror er interessert i denne tråden.

  • Brukt data eller API-er til noe spennende? Del her!

    23 Emner
    33 Innlegg
    J

    Jeg har begynt å oppdatere mine Jupyter notebooks som viser hvordan bruke Python for å hente data fra SSBs APIer.
    Du finner eksemplene her:
    📂 GitHub-repoet mitt

    Samtidig har også R-pakken PxWebApiData, som gjør det enkelt å hente data fra ulike statistikkbankers APIer (inkl. Eurostat), nylig nådd versjon 1.0
    Mer om dette her:
    📦 CRAN-siden til PxWebApiData

    Disse verktøyene kan være nyttige for datadrevne prosjekter og analyser – uansett om du foretrekker Python eller R.

    Jan Bruusgaard
    Pensjonist (tidl. SSB)

  • Diskuter og tips om møter, arrangementer og konkurranser.

    230 Emner
    306 Innlegg
    T

    I de første minuttene av dette møtet vil vi få en kort orientering om status for høringsprosessen for DCAT-AP-NO.

    Deretter vil Fredrik Øverås m.fl. presentere fra kommunenes utarbeidelse av et felles målbilde for digitalisering av arkivområdet:
    09:10 "Vår Digitale Hukommelse - Felles målbilde for digitalisering av arkivområdet"

    Noen husker kanskje at dette var med blant foredragene på Digitaliseringskonferansen i juni og du finner mer om prosjektet på KS sine sider

    Du kan logge deg på møtet via vår Arrangementsside

  • Post om datasett og API-er du ønsker å få tilgang til eller har spørsmål om.

    55 Emner
    253 Innlegg
    kjersti.stenerud.steienK

    Jeg lurer også på om det kunne vært mulig å inkludere virksomhetenes logoer i Enhetsregisteret. I dag har vi en egen tjeneste i Digdir som inneholder virksomheters logoer. De vises på sidene for virksomheten https://data.norge.no/organizations/991825827. Vi vet også at andre produkter, som Altinn Studio, har behov for virksomheters logoer.

  • Her kan du finne arenaer hvor du kan diskutere bestemte problemstillinger, eller se hvilke prosjekter andre holder på med.

    32 Emner
    85 Innlegg
    jens.andresen.osbergJ

    @maritbre Hei! Denne skulle du naturligvis fått svar på for veldig, veldig lenge siden. Så her er det all grunn til å beklage fra vår side.

    Vi kjenner ikke til at det finnes helt generelle retningslinjer for merking av KI-generert tekst. I KI-forordningens artikkel 50 stilles det krav til åpenhet for at brukeren av et KI-system må kunne forstå at de samhandler med et KI-system. I tilknytning til denne vil det nok komme standarder eller praksis for hvordan man merker KI-generert innhold.

    På et generelt grunnlag er dette med merking likevel krevende. En aktør kan oppgi at det er KI-generert, men det finnes ingen garanti for at denne informasjonen følger innholdet dersom det brukes videre i andre sammenhenger. På lengre sikt trenger man en annen tilnærming til denne problematikken. Vi kjenner til to ulike tilnærminger:

    Automatisert deteksjon av KI-materiale: Dette innebærer bruk av en KI-modell trent til å identifisere KI-generert materiale. Vi registrerer at det finnes ulike selskaper som tilbyr slike løsninger. Det er imidlertid utfordringer knyttet til nøyaktigheten av modellene, og hvordan de kan påvirke ulike grupper på en uheldig måte. I tillegg krever endringer i de store generative KI-systemer at deteksjonsverktøyene kontinuerlig oppdateres for å holde tritt. Til dette kommer også mulige teknikker for å omgå slike systemer. Dette kan du lese mer om hos Faktisk her: Kan vi stole på KI-detektorer? Vannmerking: Dette innebærer at det legges inn et usynlig vannmerke i det KI-genererte innholdet ved å påvirke sannsynlighetsfordelingen i genereringen av innholdet slik at det kan identifiseres senere. Denne artikkelen fra forskere ved universitetet i Maryland går inn på dette og jeg ser den er mye sitert: A Watermark for Large Language Models Artikkelen forklares ganske godt i denne videoen fra Universitetet i Nottingham: Ch(e)at GPT? - Computerphile
    Vi ser at Google Deepmind har kommet nokså langt med en slik tilnærming med sin Synth-ID som gjelder for flere modaliteter, inkludert bilder. Ser at dette arbeidet også henviser til artikkelen nevnt fra forskerne ved universitetet i Maryland.
    Selv om vannmerking høres ut som en god løsning, er det også noen utfordringer. Vannmerkingen må implementeres i de generative KI-modellene. Dette krever at alle leverandører av følger standarden, noe som skaper håndhevelses-utfordringer. For eksempel: Hvordan sikrer man at alle implementerer vannmerking, og hvordan gjør man dette med open-source-modeller?

    I dagens situasjon er det altså en del usikkerhet rundt merking av KI-innhold. I påvente av noen tekniske løsninger må vi da basere oss på en variant hvor vi med «good faith» opplyser om hva som er KI-generert. Spørsmålet da blir imidlertid når vi mener at vi bør opplyse om dette.

    Tekst: Vi har ikke gitt et generelt råd for merking av KI-generert tekst. Dette skyldes at vi er usikre på om et slikt generelt råd har noen verdi. Vi tror behovet for åpenhet varierer mellom ulike områder og kontekster. For eksempel har vi inntrykket av at visse grupper, slik som journalister og mediehus, har interne retningslinjer for hvordan dette skal gjøres. Vi tenker også at for enkelte offentlige virksomheter i visse sammenhenger vil det være viktig å opplyse om at innholdet er generert av KI. Fordi mer og mer tekst vil være helt eller delvis bearbeidet med et KI-verktøy, tror vi ikke det er så mye poeng å gi et generelt råd om dette, og så kan det heller være opp til de spesifikke områdene og kontekstene å vurdere dette.

    Kode: I den forrige utgaven av veiledningen fra 2023 ga vi et råd om å opplyse dersom kode var KI-generert. På dette tidspunktet var bruk av verktøy for KI-kodegenerering nokså nytt. Dette rådet er nå fjernet fordi det har blitt veldig vanlig og det mange som har innarbeidet dette i arbeidsflyten, eller som arbeider med det nå. På samme måte som med tekst, og kanskje i en enda større grad, er det usikkert hvor mye nytte brukerne har av å vite at kode er KI-generert.

    Bilder: For bilder har vi valgt å beholde rådet om merking. I tråd med tankene bak artikkel 50 i KI-forordningen, er det viktig at ingen blir forledet av innhold fra offentlige myndigheter. Med bilder fra en offentlig myndighet, er konteksten av å gi informasjon som offentlig myndighet i seg selv viktig. Derfor har dette verdi, selv om bildet kan bli flyttet og gjenbrukt uten at forbeholdet blir med videre.

  • Kommentarer på innhold i data.norge.no

    31 Emner
    114 Innlegg
    L

    Feil lenke. Får 404 (not found) når eg trykker på TilgangsURL (https://hdl.handle.net/21.11146/96) i distribusjonen

  • Kom med tilbakemeldinger på Datalandsbyen, Felles datakatalog og Transportportal.

    30 Emner
    57 Innlegg
    J

    Vi har nylig oppgradert NodeBB fra versjon 2.x til den nyeste versjonen (3.10.1), noe som har medført enkelte endringer.

    For det første har vi valgt å ta i bruk NodeBBs standardtema, Harmony, siden det tidligere temaet ikke lenger støttes. Vårt mål er å bruke flest mulig standardfunksjoner for å gjøre løsningen enklere å vedlikeholde. Harmony-temaet er mer brukervennlig og har bedre støtte for mobil og nettbrett enn det forrige temaet.

    Kalenderfunksjonen er dessverre fjernet, ettersom den tilhørende pluginen ikke lenger støttes.

    Samtykketeksten er justert for å gjøre den mer lesbar. Du kan lese den oppdaterte teksten her: https://datalandsbyen.norge.no/consent. Hvis du er enig med teksten, trenger du ikke foreta deg noe. Hvis du ikke er enig, kan du slette kontoen din under brukerprofilen.

    Vi håper dere setter pris på de nye endringene. Meld fra i kommentarfeltet om du oppdager feil i løsningen.

    Med vennlig hilsen,
    Felles datakatalog-teamet